騰訊混元發布全新視頻生成模型:14G消費級顯卡流暢運行 生成5
11月21日消息,騰訊今日,混元騰訊混元大模型團隊宣布開源最新視頻生成模型HunyuanVideo 1.5,發布費級這是全新一款基于Diffusion Transformer(DiT)架構、參數為8.3B的視頻生成生成輕量級視頻生成模型,支持生成5-10秒的模型高清視頻。
該模型已經搶先在“元寶”上線,消顯普通用戶可以直接體驗,流暢可通過兩種方式:一是運行輸入文字描述(Prompt),直接實現“文生視頻”;二是騰訊上傳圖片配合Prompt,輕松將靜態圖片轉化為動態視頻?;煸?/p>
據介紹,發布費級HunyuanVideo 1.5模型能力全面,全新支持中英文輸入的視頻生成生成文生視頻與圖生視頻。
其中,模型圖生視頻能力展現出圖像與視頻的高度一致性,生成的視頻在色調、光影、場景、主體和細節等方面都能與原圖較好匹配。
模型還具備強指令理解與遵循能力,能夠精準地實現多樣化場景,包括運鏡、流暢運動、真實的物理規律遵循、寫實人物和人物情緒表情等多種指令。
在元寶中可以通過文字和圖片生成視頻
同時,HunyuanVideo 1.5支持寫實、動畫、積木等多種風格,并可在視頻中生成中英文文字,滿足多樣化內容創作需求。
在畫質方面,模型可原生生成480p和720p高清視頻,并可通過超分模型提升至1080p電影級畫質。
此前,視頻生成領域的開源SOTA旗艦模型至少有20B,需要超過50GB顯卡方可部署。
HunyuanVideo 1.5定位為“開源小鋼炮”,顯著降低了使用門檻可在14G顯存的消費級顯卡上流暢運行,真正讓每一位開發者和創作者都能“玩起來”。
HunyuanVideo1.5通過多層次的技術創新,實現了生成效果、性能與尺寸上的平衡。
HunyuanVideo 1.5創新的SSTA稀疏注意力機制(全稱Selective and Sliding Tile Attention,選擇性滑動分塊注意力)在保證高質量生成的同時顯著提升推理效率,配合多階段漸進式訓練策略,在運動連貫性、語義遵循等關鍵維度均達到商用水平。
-
小鵬X9行業首發三排電動三折疊:秒變1米8瑜伽房《刺客信條:幻景》大型DLC更新!耕升 RTX 5070 追風 OC探索新區域魏建軍:車企發布電動車專屬底盤的說法 全部是謊言路虎走錯路口直接倒車被貨車撞 男子:我看后視鏡了 他離很遠微軟終于聽見了!日歷彈出面板回歸Windows 11:用戶等了整整4年“蘇超”南京隊西班牙籍主教練:足球是城市間的一種交流方式美國之外首個!我國異種器官移植獼猴存活已滿一年最強蘋果手機!iPhone 18 Pro系列10大看點匯總國產算力賽點:超節點長沙扎堆登場 “開放之道”與“極致之術”競逐未來中國廠商徹底不買H20!黃仁勛不發愁:AI無泡沫 手握5000億美元訂單
- ·解決公共場合藍屏尷尬!微軟Win11新功能:藍屏畫面15秒自動消失
- ·最強蘋果手機!iPhone 18 Pro系列10大看點匯總
- ·蘋果又一突破:iPhone Air USB
- ·昨天一個網站的更新 讓外國人集體斷網6小時
- ·網易三季度營收增長8.2%:《逆水寒》熱度長青 成游戲增長核心
- ·小米汽車官宣:第50萬輛整車正式下線!
- ·北京上演“天空幻境”:朝霞美成壁紙
- ·“蘇超”南京隊西班牙籍主教練:足球是城市間的一種交流方式
- ·古天樂認證!樂道L90黑騎士特別版正式上市:22.08萬起 限量999臺
- ·美國之外首個!我國異種器官移植獼猴存活已滿一年
- ·歐盟宣布對部分進口鐵合金實施最終保障措施
- ·蘋果在印度推出月付AppleCare+ 首度覆蓋iPhone盜竊與丟失
- ·新研究:OpenAI算力需求持續激增 2028年支出將達1100億美元
- ·最強蘋果手機!iPhone 18 Pro系列10大看點匯總
- ·華為史上首款 Mate 80系列支持eSIM:最高能裝四個號
- ·三亞亞沙會成立8個競賽場館(群)團隊 全面沖刺籌備工作
